5.1 Scatter Diagrams

散点图与相关性分析 - 知识点总结

核心概念总结

双变量数据 (Bivariate Data)

双变量数据是为两个变量提供成对值的数据。例如,呼吸频率与脉搏率的关系数据。

双变量数据可以用散点图表示,其中每个点代表一对数据值。

散点表示例:呼吸频率与脉搏率关系
呼吸频率 (次/分钟) 脉搏率 (次/分钟) 0 10 20 30 40 0 40 80 120 160

变量类型

相关性 (Correlation)

相关性描述两个变量之间线性关系的性质和强度。相关性不暗示因果关系,只表示变量间的关联程度。

正相关 (Positive Correlation)

当一个变量增加时,另一个变量也增加

负相关 (Negative Correlation)

当一个变量增加时,另一个变量减少

无相关 (No Correlation)

变量间没有明显的线性关系

注意事项 (Watch out)

只能用相关性描述显示线性关系的数据。没有线性相关性的变量仍然可能显示非线性关系。

相关性不等于因果关系!两个变量显示相关性并不一定意味着存在因果关系。

计算方法总结

散点图绘制步骤

  1. 确定自变量和因变量,分别分配给x轴和y轴
  2. 根据数据范围合理设置坐标轴刻度和标签
  3. 对每对数据值,在坐标系中绘制相应的点
  4. 添加图表标题和坐标轴标签
  5. 分析散点图中点的分布模式,判断相关性类型

相关性判断要点

相关性强度比较
强正相关 弱正相关 强负相关 弱负相关

应用技巧

散点图分析技巧

因果关系判断

判断因果关系时,需要考虑问题的背景并运用常识,不能仅根据相关性得出结论。

建立因果关系通常需要对照实验、控制变量和理论基础支持。

重要提醒

常见误区

考试要点